查看原文
其他

许成钢 | 人工智能:又一场创造性破坏的产业革命

许成钢 勿食我黍
2024-08-28

列奥·施特劳斯(Leo Strauss,1899年9月20日-1973年10月18日),生于德国马堡的犹太人,曾就读于马堡大学,1921年获哲学博士学位;1925至1932年,任职于柏林犹太研究学院。1938年移居美国。1938至1949年任教于纽约新社会研究院;1949至1968年任教于芝加哥大学政治学系。列奥·施特劳斯被认为是20世纪极其深刻的思想家。他对经典文本的细致阅读与阐释方法,构成了20世纪解释学的一个重要发展;他的全部政治哲学研究致力于检讨西方文明的总体进程,强调重新开启古人与今人的争执,并由此审视当代思想的种种潮流。



一、第四次产业革命


在当下,许多人都有这个共识:我们正在经历一场刚刚开始的产业革命,而这个产业革命的核心部分是人工智能。这里需要交代一下产业革命的重要性,我们习惯性地将世界上的国家分为发达国家和发展中国家,这种差距是产业革命之后才有的,产业革命之前,各国没有太大差距。
 
第一次产业革命,产生于英国,核心内容是人造动力,即蒸汽机的发明。第二次产业革命,产生于英美,核心内容是电力的发明。第三次产业革命,产生于英美,核心内容是计算机的发明。第四次产业革命正在兴起,它跟第三次产业革命有很多相似之处。
 
首先,第四次产业革命的核心技术是人工智能,这个技术在此之前已经有了相当程度的发展。就如同第三次产业革命时,作为核心技术的计算机的基本原理,在20世纪40年代已经形成了,但它对社会的影响是后来才产生的。其次,产业革命早期存在着巨大的不确定性,没有人知道新技术会对社会产生什么样的影响,甚至连接下来需要什么样的器件都没人知道。我有意地在强调这些内容,是因为现在发生的事情跟那时非常相似。正在兴起的第四次产业革命诞生于美国,我们之所以要在这里讨论产业革命的诞生地,是为了讨论产业革命得以诞生的背景条件。


1、产业革命诞生的背景条件
 
今天,各国政府都高度重视人工智能,世界上至少有18个国家制订了人工智能的发展战略和行动方案。美国总统特朗普曾颁布行政令,其中包括要大规模调动联邦政府的资金,用在人工智能上。俄国总统普京说得很玄乎,他说人工智能不仅对于俄罗斯是未来,也是全世界的未来,这一领域的领先者将称霸世界。
 
创新过程
 
那么,什么样子的制度才能够促进科学研究发展?我们先来看一看爱因斯坦的观点。为什么要提爱因斯坦?因为100多年前爱因斯坦的突破奠定了今天世界的基础,我们至今生活在爱因斯坦的世界里。他说,如果我们早就了解我们正在做的工作,我们的工作就不能称之为研究了。这句话非常深刻。没有人能计划他做的工作,因为没有人能事先知道具体该怎么做,这个世界应该是什么样子。所有突破都是在过程中摸索的,而不是事先知道的。


他还说,想象力是最高形式的研究。想象力就不是别人能告诉你的,而是你自己想象的,科学家和科学家之间的差距全在想象力上。当我们讲制度的时候,管理制度都是自上而下的,核心内容是如何提供激励机制,也就是奖惩。爱因斯坦认为像他这样做研究的人,如果只因为畏惧惩罚和贪图奖励才能努力工作,那就成了一群无可救药的人了。
 
激励机制
 
当我们讲创新的时候,制度的核心问题是激励机制。因为创新碰到的第一个问题是:在一个社会中,你怎么知道谁是可以进行创新的人?第二个问题是:什么东西在驱动他的创新?其实,这种革命性的、突破性的发明创造的原始动力是好奇,而不是为了有用。为了有用,是想不出革命性的东西的。

历史上的那些科学家,与电相关的法拉第、赫兹,与计算机相关的图灵,与人工智能相关的麦卡锡等,包括发现量子力学、固体物理、半导体、DNA、RNA以及测定人类基因图谱的这些科学家,他们的驱动力都是好奇心,都是来自于探索这个世界的渴望。紧接着,就需要跟随性的研究和应用性的研究,这些研究需要外来激励机制的支撑。在原始突破阶段,好奇心本身是最强的激励机制,但到了跟随性、应用性阶段,内心的满意度会弱一些,而外来的名利刺激就非常重要。比如,各种奖励包括论文、奖金等。再到实用目的阶段,就必须有巨大的外来刺激,也就是在市场上直接获得商业利益的激励。
 
当我们讲产权时,就是在讲市场机制。个人的产权决定了如何分配资源。制度指的就是在这个社会经济里,谁拥有资源,谁决定资源配置,这个问题直接就决定了这个集体中有没有创新的自由,有没有创新的动力。

简单总结一下,科学技术的重大突破基本上都不来自于计划,而是来自于无数的自由探索。这里非常重要的是两个关键词,第一是自由,第二是无数,二者缺一不可。而无数的自由探讨是需要制度保证的,因为非常不确定性,没人知道谁能做成,所以需要大量的探索,最后的结果一定是优胜劣汰出来的,大多数探索会失败,个别会胜出。
 
2、产业革命是创造性的破坏过程
 
“创造性的破坏过程”这个概念是熊彼得40年代提出的。首先,产生的革命性变化背后,最重要的是对发明家、企业家提供激励机制。在市场制度下,核心是知识产权,产权里面包括了两个大部分,一部分是有形资产的产权;一部分是知识产权,这是无形资产。创新越重要,对知识产权的保护就越重要,你可以想象当盗窃、侵犯知识产权的行为在一个社会上盛行,就严重摧毁了创新的激励机制。所以在一个社会里,是不是有很多人、很多机构愿意从事重大的、困难的、冒风险的创新工作,直接和有没有对知识产权的保护有关。在知识产权的保护中,离不开一个非常基本的概念,就是垄断。什么是专利?专利就是在一个规定的时间段里拥有垄断权,这是合法的,也是必须的。
 
第二个基本要素就是市场的优胜劣汰。只有在优胜劣汰的过程中,才有可能进行大规模的筛选,把不满足市场需要的东西筛下去,把优秀的东西凸显出来。这也是为什么创新是高度不确定的,你发明的东西能不能在市场上成功,这是事先无法预料的。
 
第三个基本要素就是保护民间投资。为什么民间投资如此重要?民间投资是在市场上操作的,它的灵活性与对市场的判断相关。没有民间投资的话,大量的个人发明是很难获得资助的。保护民间的投资,本身也就是在保护个人发明。所以,产业革命为什么叫做“创造性的破坏过程”,指的就是这个优胜劣汰的过程。优胜劣汰的劣在历史上曾经是特别好的,只是因为新的东西来了,把它取代了,把它淘汰了。
 
当我们看到新东西出现的时候,很多人想的是怎么能够后来居上,其实你跟着别人走,永远不可能超过别人,只有你发明一个别人没有的东西,你才有可能做到超越。
 
3、深而广的人工智能应用革命
 
我们继续进行人工智能的讨论。从下图可以看出,人工智能是个大概念,机器学习是人工智能里的一个概念,深度学习是机器学习里的一个概念。
 
举个自动驾驶的例子。人工智能必须依靠布置在车上的大量传感器来感知外部情况,在感知过程中会制造出大量数据,这些数据被深度神经网络里(人造的神经网络)读取,然后通过计算来决定以什么速度、往哪个方向走,所谓自动驾驶指的就是这个。全自动的无人驾驶的最大困难在于,处理复杂状态下的车和车之间的协调问题。传感器要收集所有的相关信息,而且这些信息需要立即处理,这时候问题就来了,现在的传输系统无法做到立即处理。
 
为什么5G重要?5G解决的就是这个问题。如果所有车都在5G环境中行驶,传感器上的信息可以实时互传,接下来才需要人工智能的处理、计算等等。所以全自动的无人驾驶什么时候能推广,5G是个先决条件。没有5G,就无法保证数据的实时送达,也无法用人工智能去实时计算。
 
另一个例子是阿里,阿里每年光棍节的交易是全球最大的,这是阿里创造的世界纪录。它是怎么做到的?靠的是人工智能。阿里从美国请来一流的人工智能教授,领导着500人团队设计的人工智能,用来保证高速处理这么多单的交易,才使得每年的光棍节可以搞这么大。再者,蚂蚁金服能够迅速利用网络方式提供贷款,靠的也是人工智能。


二、中美人工智能指数


下面跟大家分享《中国人工智能指数报告》的数据。《中国人工智能指数报告》由我和武汉大学大数据与云计算实验室主任崔晓晖教授团队共同研究制作。希望帮助大家更好理解中美人工智能发展现状。
 
1、学术领域,中国学术论文激增,但千级期刊论文引用逊于美国
 
在学术会议参与方面,中美两国学者参加学术会议呈不断增长趋势,而美国每年都要高出中国。
 
图1:中美人工智能期刊论文年度发表量对比
 
从1995年至今,虽然美国在人工智能领域发表的论文数量整体超过中国,但是中国的增长速度较快。
 
图2:中美学者参加所有人工智能学术会议的总数
  
人工智能领域的迅速发展,使得大量学者常常会把自己的短期研究成果首先会发表在学术会议上(甚至只发表在学术会议上),之后便投入到实践工作中。而学术会议的常规是,申请者的论文得到会议学术委员会或组织者接受,才获得参会资格。因此,参会人数通常可以视为会议论文发表的数量。
 
图3:中美人工智能期刊论文被引用总数
 
为了进一步将两国学者发表的论文质量进行对比,报告将论文的引用数量划分为了6个等级进行分析,分别是千级(引用量 1000 及以上),百千级(引用量 500-999),百级(引用量 100-499),十级(引用量 10-99),个级(引用量 1-9)以及零 级(引用量 0)引用量文章。统计的次数是每篇论文截止 2018 年 10 月的总引用次数。以千级和零级两个极端的级别为例:


图4:中美千级期刊论文引用总数量对比分析
 
对有高等级影响力的千级论文(是指每一篇论文被引用的数字超过了1000次),中国与美国差距巨大,中国只有个别的产生大影响力的论文,而在美国则比较多一些。
 
图5:中美零级期刊论文发表总数量对比分析
 
这一部分是发表的这些论文是从来没有被任何人引用过的。从2011年之后,中国大幅度的超过美国,而且超过了很多,这个很有趣。为什么中国很多论文从来不被引用?原因可能有两点:第一,这些论文讨论的问题是在比较狭窄范围里的应用问题,有兴趣的人少。第二,中国的激励机制所致。中国的科研体制是计算研究人员在国际期刊上发了多少篇文章,为了职称评定,学者被迫拼命发文章,却不注重文章的影响力和价值贡献。
 
2.人才分布,AI人才中国是精英模式,美国则量大面广
 
决定一国人工智能长期竞争力的是人才要素,美国的人工智能工程师远比中国多。
 
图6:根据从业时间分为五个不同类别进行的中美AI人才分布对比
 
据领英(LinkedIn)人才数据库显示,中国的AI人才总数为5万人,而美国的AI人才总数为83万人。美国AI人才总数是中国的16.5倍之多。如果把中国人工智能领域所有的从业人员(领英里面搜集到的),按照他们已经工作多少年划分的话,可以看到,中国人工智能领域工作10年以上的不到39%,相比之下,美国超过71%的人工智能领域的人,工作了10年以上。在中国,人工智能是更年轻的行业,而在美国虽然领域是年轻的,但是里面的多数人并不年轻,是有充分经验的。
 
图7:根据子领域划分对比的两国AI人才分布比例
 
人才分布方面,中国在智能交通/自动驾驶,智能/精准营销, 硬件/GPU/智能芯片需求比例要多于美国,但在算法、机器学习的方面,美国不但人才的比例比中国大,人才总数也是中国的20多倍。
 
3.产业领域,AI创业公司数量少于美国
 
从产业领域的角度看,中国活跃的人工智能创业公司在2012年之前要多于美国,但是在2012年以后美国超过中国,且增长速度大幅度提升,而中国在2015年以后开始下降。
图8:中美人工智能领域创业公司数量对比
 
据了解,美国私营部门正在开足马力发展AI技术。美国与人工智能有关的企业数量远超中国。美国的投资力度似乎也很大,例如,谷歌公司、苹果公司、脸书网站、国际商用机器公司(IBM)、微软公司和亚马逊公司等总部设在美国的企业,其研发支出总计高达540亿美元,其中大部分开支进入人工智能科研领域。
 
最近二十几年里,中国活跃的人工智能初创公司整体上呈快速发展趋势,2016年超过400家,达到顶峰。中国活跃的人工智能初创公司数字在2012年之前多于美国,但是在2012年以后被美国超越。尤其是在2016年之后,美国的人工智能初创公司数量快速上升, 2018年超过600家,而中国则在2016年之后下降,在2018年降至不到200家。
 
4.开源软件包的使用和开发,93%的中国研究者使用的开源软件包是美国开发的
 
中国在最近三年里,关注人工智能开源软件包的总数迅速上升,并在2017年秋超过了美国。
 
图9:中美 AI 研究者的 AI 软件包关注总数对比
 
但是,几乎93%的中国研究者使用的人工智能开源软件包,是美国的机构开发提供的。中美两国人工智能研究者使用最多的软件包是Google开发的TensorFlow。在2018年初,中美研究人员对此的关注人数,分别达到将近9000人和约7000人。
 
整体上中、美AI研究者关注美国机构开发的开源AI软件包的数字,相当于他们关注中国机构开放的软件包数字的20几倍。这表明中国研究者在基本算法方面,对美国开源软件包的依赖。
 
5.公众认知及媒体报道,中国对AI的公众认知正面情感高于美国
 
从公共认知及媒体报道的角度看,中美两国对于人工智能的报道正面情感要高于负面情感,而中国的正面情感比例相对更高一些。
 
图10:中国、全球(英语国家)人工智能文章正负比例
 
《中国人工智能指数报告》收集的媒体大数据显示,在2014年之前,中国媒体对人工智能的正面报道略多于负面,差距不大。此后,负面报道持续下降,正面报道逐年增加,全面压倒负面报道。
 
相比之下,全球英语世界的报道,多数属于没有正负之分的中性。在2013年到2015年之间,正负报道之间的差距曾经大幅度缩小。在2016之后,正面报道大幅度提高,而负面报道则没有显著变化。这个趋势与2016年之后美国人工智能投资初创企业的快速增长高度相关。总之,在深度学习的应用方面,如果我们只看规模,中国和美国已经非常接近有一些地方甚至是超过。
 
但是,在人工智能的基本算法、芯片、传感器等等许多的方面,中国都落后于世界上多数的发达国家,除了美国外,还有比如,英国、德国、日本、以色列等国家。美国的AI产业布局非常完善,基础层、技术层和应用层都有涉及,尤其是在算法、芯片和数据等产业核心领域,积累了强大的技术创新优势,各层级企业数量全面领先中国。相比较而言,中国在基础元器件、基础工艺等方面差距较大。

三、人工智能:巨大的机遇和挑战


人工智能的发展,无论是速度、广度,还是深度已经是革命性的。比如金融监管、会计、网上客服等等很多服务都不是真人提供的。电商的快速交易,以及网上金融的相关领域,背后基本上都是人工智能在支撑。我这里主要提及高技术领域、金融领域和零售领域,因为在这三个领域里,背后支撑运营的都是人工智能。很多领域都会深刻地被它改变。
 
从技术角度来概要一下这方面的发展,我想要强调的要点是:目前人工智能或深度学习的应用方面,核心在于能不能应用在于你所在的那个场景,你要有能力识别它,有能力去执行它,深度学习里的核心部分就是,你走得快,形成规模,你的边际成本就几乎是零。而你能不能走得早,全在于你有没有能力识别你的场景。如何识别能否应用深度学习的场景?靠你和人工智能专家的联手。
 
最后,当我们做对比时,我们看到人工智能的整体状态,这里我们应该重视三个方面:
 
新算法。新算法中一定会有重大突破,会打破我们熟悉的机器学习、深度学习,打开广泛的应用大门。这里非常重要的部分是,算法跟物联网怎么连接,自己解决数据搜集问题,这是其中的重要部分。
 
量子计算。这是一个全新的领域,跟人们已经知道的计算机没有太大关系,这就取决于整个物理科学、量子力学方面的基础研究。
 
传感器。物联网顾名思义就是每一个东西上都有传感器,传感器的研究依赖于物理学、化学、生命科学等基础学科。这不是你想发明就能发明出来的,那是无数人的想象力积累出来的。
 
本文来源于“前瞻网”。


—End—


点击下列标题,延伸阅读:
许成钢 | 逃出“制度陷阱”——第四次产业革命中的观念革新与应对之法
【改革开放40年】许成钢:为民企创造安全和稳定发展的环境
经济学家谈经济学 | 许成钢、周其仁、汪丁丁、姚洋

----------------------------------


【点击图片 推荐阅读

▼ 

----------------------------------

混乱时代   阅读常识

长按二维码关注!


点击阅读原文直达好书
继续滑动看下一个
勿食我黍
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存